home *** CD-ROM | disk | FTP | other *** search
/ Cream of the Crop 12 / Cream of the Crop 12 (Part II) / Cream of the Crop 12 (Part II).iso / OS2 / UNHTML13.ZIP / UNHTML.DOC < prev    next >
Encoding:
Text File  |  1996-04-15  |  4.1 KB  |  152 lines

  1.                            --==| UNHTML v1.3 |==--
  2.  
  3.          (C)opyright 1996 by Jawed Karim <kari0022@gold.tc.umn.edu>
  4.  
  5.  
  6.  
  7. What's New
  8. ==========
  9.  
  10. UNHTML 1.3 has several improvements over 1.0 :
  11.  
  12.         
  13.         o The output files contain fewer empty lines, thus
  14.           reducing its size.
  15.  
  16.         o An ELF executable for Linux is included.
  17.  
  18.         o An editor can be launched after completion to
  19.           manually edit the output file.
  20.  
  21.         o UNHTML counts how many HTML tags were removed.
  22.  
  23.         o Special character symbols '&' and ';' no longer
  24.           cause trouble within '<' and '>'.
  25.  
  26.  
  27. Instructions
  28. ============
  29.  
  30. XXXX unhtml v1.3 -- Removes HTML code from ascii files.
  31. (C)opyright 1996 by Jawed Karim <kari0022@gold.tc.umn.edu>
  32.  
  33. syntax: unhtml <inputfile> <outputfile>
  34.  
  35.         
  36.         <inputfile> : The file that contains HTML code.
  37.  
  38.         <outputfile>: After removing the HTML code, the text
  39.                       will be written to this file.
  40.  
  41.  
  42.         EXAMPLE: unhtml index.html index.txt
  43.  
  44.         Will remove any HTML code from index.html and write plain text
  45.         to file index.txt.
  46.  
  47.         After completion, the following message will be displayed:
  48.  
  49. ---------- Done. Removed 110 HTML tags ----------
  50.  
  51. edit index.txt manually [y] ?
  52.  
  53.         If you would like to edit the output file manually with a text
  54.         editor, press 'y' at this point. If not, just hit enter. UNHTML
  55.         will execute a batch file, depending on which system you are 
  56.         using.
  57.  
  58.         under Linux: command 'pico'  will be executed
  59.         under MSDOS: command 'edit'  will be executed
  60.         under OS/2 : command 'tedit' will be executed
  61.  
  62.         Should you get an error message under MSDOS or OS/2, make a 
  63.         batchfile that points to an editor such as the following 
  64.         example of a DOS BATCHFILE:
  65.  
  66.         ---CUT HERE---
  67.         c:\dos\edit %1
  68.         ---CUT HERE---         
  69.         
  70.         Save this file as 'EDIT.BAT' in the same path as UNHTML, or have
  71.         it in a path that is contained in your PATH variable.
  72.            
  73.         Accordingly the OS/2 BATCHFILE would look like this:
  74.  
  75.         ---CUT HERE---
  76.         c:\os2\tedit.exe %1
  77.         ---CUT HERE---
  78.         
  79.         Save this file as 'TEDIT.CMD' in the same path as UNHTML, or have
  80.         it in a path that is contained in your PATH variable.
  81.  
  82.         Under Linux, if you get an error message, make a symbolic link
  83.         that points to whichever editor you use. Name the link 'pico'.
  84.         For more help, see: man ln
  85.  
  86.  
  87. OS/2 Warp
  88. =========
  89.  
  90. Compiler used: OS/2 EMX GCC v2.7.2
  91.  
  92. This executable requires you to have the EMX Runtime version v0.9b or
  93. higher. It is available at:
  94.  
  95. ftp://hobbes.nmsu.edu/os2/unix/emx09b/emxrt.zip
  96.  
  97. This is worth getting since you will be able to use long filenames with
  98. UNHTML for OS/2.
  99.  
  100.  
  101. Linux
  102. =====
  103.  
  104. Compiler used: GNU GCC v2.7.0
  105.  
  106. This ELF executable has been tested under Linux 1.2.13.
  107.  
  108.  
  109. MSDOS
  110. =====
  111.  
  112. Compiler used: djgpp GCC v2.6.3
  113.  
  114. Unless you are running UNHTML for MSDOS in an OS/2, or Windows(95/3.1/NT)
  115. DOS window, you need to have the file CWSDPMI.EXE in your path variable,
  116. or in the same directory as UNHTML.
  117.  
  118.  
  119. Known Problems
  120. ==============
  121.  
  122. Right now, UNHTML assumes that HTML code follows after any '&' or '<'
  123. character and is terminated with ';' or '>'. The exception to this is the
  124. case where '&' or ';' appear within '<' and '>'. Therefore, any of these
  125. characters that are not part of an HTML tag may cause problems.
  126.  
  127.  
  128. Where to find updates
  129. =====================
  130.  
  131. New UNHTML versions will be posted on:
  132.  
  133. http://umn.edu/~kari0022
  134.  
  135. or search for "Jawed Karim" on Yahoo! (http://www.yahoo.com)
  136.  
  137. or email Jawed Karim at:
  138.  
  139. Jawed.Karim-1@umn.edu
  140. kari0022@gold.tc.umn.edu
  141.  
  142. -----BEGIN PGP PUBLIC KEY BLOCK-----
  143. Version: 2.6.2
  144.  
  145. mQBtAzAEEsYAAAEDAKkXRZuRhuJ919uqvT4jzBRNw5Xi6+N5uH3QIoyPR1qeA3NW
  146. 60ji+3Yo2lOewzKrw0z8Aon5KsCfR/dAYJKpWIbQCI9WEedArFRxP48ClsHneWB9
  147. VYmMQnpu4PUi2KOHDQAFEbQmSmF3ZWQgS2FyaW0gPGthcmkwMDIyQGdvbGQudGMu
  148. dW1uLmVkdT4=
  149. =O8+H
  150. -----END PGP PUBLIC KEY BLOCK-------
  151.  
  152.